package br.org.eda.wj.pdfinder.logica;

import java.io.IOException;

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.util.PDFTextStripper;

import br.org.eda.wj.pdfinder.interfaces.IFExtratorTexto;

public class ExtratorTextoImpl implements IFExtratorTexto {

	/**
	 * Le e retorna o conteudo (apenas texto) do arquivo PDF selecionado, com todas as palavras minusculas
	 */

	public String extraiTextoDoPDF(String caminho) {

		PDDocument pdfDocument = null;

		try {
			pdfDocument = PDDocument.load(caminho);
			PDFTextStripper stripper = new PDFTextStripper();
			String texto = stripper.getText(pdfDocument).toLowerCase(); // variavel "texto" recebe o texto retirado
																		//	do arquivo PDF, com todas as palavras minusculas
			return texto;

		} catch (IOException e) {
			throw new RuntimeException(e);
		} finally {
			if (pdfDocument != null) try {
				pdfDocument.close();
			} catch (IOException e) {
				throw new RuntimeException(e);
		
			}
			
		}
	}
}
